目的 全面了解滇东南特有濒危植物长梗杜鹃转录组SSR位点的分布及序列特征, 为长梗杜鹃的保护和合理开发利用提供遗传学资料, 为同属植物及近缘种SSR标记的开发及遗传研究提供便利。 方法 利用Illumina Hiseq 4000高通量测序平台对长梗杜鹃叶片进行转录组测序, 再通过MISA软件对测序所得Unigenes进行SSR位点的发掘和分析。 结果 发现含SSR的序列17 354条, 共得到23 192个SSR, 出现频率为31.30%, 平均每3 kb出现1个SSR。二碱基和三碱基重复为长梗杜鹃SSR主要重复单元类型, 分别占SSR总数的69.25%和15.07%, 187种重复基元中, 所占比例最高的是(AG/CT)n(62.01%), 其次是(A/T)n(12.34%)、(AC/GT)n(4.52%)和(AAG/CTT)n(4.23%)。在SSR和CDS的交集基因中, 共发现15 908个SSR位点, 其中2 792个位于编码区, 出现频率为0.076 SSR/kb, 而非编码区为0.344 SSR/kb, 在基因编码区中出现频率最高的是三碱基重复(1 356, 48.57%)。在不同长度重复单元中, 二碱基重复SSR长度变异程度最高, 其次是单碱基重复。长梗杜鹃SSR的频率和长度呈显著负相关(P < 0.01), 相关系数为-0.566。 结论 长梗杜鹃转录组SSR位点的出现频率高、分布密度大、基元类型丰富、重复次数较高、长片段较多, 具有较高的多态性潜能, 用于遗传分析的潜力很大, 能满足该物种的保护遗传学研究。